聖心女子大学国際交流学科
2024年秋学期
祝: ノーベル経済学賞受賞3人(2019年)
受賞理由:
「貧困緩和に実験的手法を導入した功績。貧困(という大きな)問題を小さな扱いやすい問題に分解し、実験を使って対策を示した。」
長所
貢献
短所
短所
倫理上、母乳育児や母乳育児に金銭的誘因を与える「推奨」を実験できないが、母乳育児の非金銭的「推奨」(内容伝達)を実験しても倫理的に問題ない
ただし、推奨内容が統御群(比較対象)の女性に伝わらないか統御は難しい
実験がうまくいき、効果があると分かっても、政策に採用されるかは別問題
政治家および投票基盤が政策実施=得策と思わねばならないから
実験は思いついた政策に効果があるか気軽に試せるが、必要となる作業監理と予算は多いために、本当に検討する価値のある政策を選ばないと資源の無駄
投与と反応を見る疫学研究ではなく、人々の意志決定と行動選択を含む経済学研究なので計測に費用がかかる
この記事には問題があります。何でしょうか。
問題を理解するためには、インパクト評価のキー・タームを知る必要があります
\(A\)と\(B\)が相関: さまざまな因果関係があり得る A correlation between \(A\) and \(B\) can include multitude of cases.
笑いは健康(自己申告)を引き起こすか?
Does laughter cause (self-reported) healthiness?
この研究のデザインは因果関係を明らかにできるか?
因果関係と相関関係は同じではない
\[ \begin{aligned} \mbox{試験点数}&=20+20*D+e D&= \left\{ \begin{array}{c} 0 1 \end{array} \right. \quad \mbox{if 塾に週1時間以上} \left\{ \begin{array}{l} \mbox{通わない} \mbox{通う} \end{array} \right. \end{aligned} \]
\(D\)はダミー変数dummy variableと呼ばれる0と1の2つの値をとる離散変数。2つの値しかとらないので2項変数binary variableとも呼ばれる。ここでは塾に週1時間以上通うと1、そうではない場合は0という値をとる変数。塾に通う人と通わない人にグループ分けできる。\(e\)は誤差を表す確率変数で誤差項error termという。
ダミー変数は質的情報を表現できる:
\[ \mbox{試験点数}=20+20*D+e \]
これが因果関係の場合: 塾に通う\(\Rightarrow\)点数が40点になる、という解釈になる。
でも、方程式は相関関係を表す場合もある。
「勉強好き」という欠落変数omitted variableが試験点数と塾通いに同時に影響を与えていて、試験点数と塾通いの間に因果的な関係はない。
方程式は逆の因果関係を表す場合もある。
この場合、点数\(\Rightarrow\)塾通いという逆の因果関係が成り立っている。
方程式は必ずしも右辺\(\Rightarrow\)左辺の因果関係ばかりではなく、逆方向の因果関係や欠落変数を通じた相関関係も含む。
因果関係を示すためには特定の条件が必要。その条件がない通常の回帰式の場合、相関関係までしか読み取ることができない。
予測だけなら相関関係で十分
でも、相関関係からは理由やメカニズム(因果関係のどの組み合わせか)は分からない
相関関係に頼った予測はメカニズムを検討しないため、理論なき計測measurement without a theoryと揶揄されることもある
因果関係を示す方法: ランダム化統御試験randomised controlled trial (RCT)
プロジェクト評価の報告書にはさらっとこんな結論が散見される
「プロジェクトによって健康状態が改善された」“with the project, health status improved.”
インパクトを知る上で適切な比較か? Is this a legit comparison?
殆どの場合、不適切 Almost always, no. → 自己選抜の図
下記のようにインパクトを計測できれば、政策が結果指標\(y_{i}\)を変えたといえる
We can say a policy changed \(y_{i}\) when we can compute its causal impact on \(y_{i}\) as
(\(i\)が政策に影響されたときの\(y_{i}\))\(-(i\)が政策に影響されなかったときの\(y_{i}\))
\[ \begin{aligned} (y_{i}|D_{i}=1) &- (y_{i}|D_{i}=0), \quad \mbox{or,} y_{i1}&-y_{i0}.%, \quad y_{i0}=y_{i}|D=0, \ y_{i1}=y_{i}|D=1. \end{aligned} \]
個人\(i\)の治療効果treatment effect of policy for individual \(i\):
\[ (y_{i}|D_{i}=1)-(y_{i}|D_{i}=0)= y_{1i}-y_{0i}. \]
プログラム評価での根源的問題 The fundamental problem in program evaluation
治療群に属するときの\(y_{i}\)と統御群に属するときの\(y_{i}\)を同時に観察できない We cannot observe \(y_{i}\) in the treated and in the control for the same individual \(i\) simultaneously.
\(\Leftrightarrow\)
各個人\(i\)の結果指標\(y_{i}\)の
\(\Leftrightarrow\)
言い換えれば、仮定なしには政策の効果を計算することはできないIn other words, we cannot compute the causal impacts of a policy for each individual \(i\) without further assumptions.
CFは何か? What are the CFs?
何も仮定しないと、個人\(i\)の政策効果は計算できない
しかし、政策裨益をランダム化をすると、政策の平均治療効果average treatment effect (ATE)は推計できるBut under treatment randomisation, we can estimate the average causal impacts of a policy, the average treatment effect (ATE). \[ ATE=\E[y_{i}|D_{i}=1]-\E[y_{i}|D_{i}=0]. \]
個人\(i\)のではなく、個人\(i\)の属する母集団の平均的な治療効果
\(\E\)は母集団全体で平均を取っていることを示す期待値記号\(\E\) is an expectation operator that indcates we are taking the mean over the entire population that \(i\) belongs to
以下の思考実験を考えるConsider the following thought experiment.
ATEを(一致推計量consistent estimator [標本サイズが無限大になると真の値になる推計量]として)得る条件 Conditions that make the ATE estimate consistent are
2.は単純化のために利用。グループごとにインパクトが違うなら、グループをもっと細かく分ければいい。2. is used for simplification. If the impact is different across subgroups, we can use finer grouping.
1.が最も重要。ランダムに割り振ることによって、各グループの特徴の分布が近似。1. is of most importance at this stage. It is randomisation of treatment status among individuals that gives similarity in distributions.
実験をしてからの手順
実験をしてからの手順
統計的推論で得る\(p\)値(\(p\) value)は帰無仮説が成り立つ確率と考えていい
5%をカットオフ
と表現されることが多いが、推奨できない
\(\leftarrow\) 4.99%と5.01%の差は無視可能なのに表現が違いすぎる、四捨五入するとき4.4%と4.5%の差、もしくは、4.95%と4.94%の差
実験をしてからの手順
ランダム化確認: permutation test (並べ替え検定), randomisation test (確率化検定)
帰無仮説null hypothesis: グループaの分布=グループbの分布
実験をしてからの手順
ランダム化確認: permutation test (並べ替え検定), randomisation test (確率化検定)
バングラデシュ最貧困層への貸付実験: 大規模貸付グループと小規模貸付グループの比較
>p1cm<>p.25cm<>p10cm< Source:& & Estimated with GUK administrative and survey data. Notes: & 1. & R’s package coin is used for baseline group mean covariates to conduct approximate permutation tests. &2. & Number of repetition is set to 100000. Step-down method is used to adjust for multiple testing of a multi-factor grouping variable. 40 are lost to flood before arm assignment.
実験をしてからの手順
他要因排除の確認 (placebo tests, falsification tests)
治療対象選定をランダム化するとATEの一致推計量が得られるRandomisation of treatment status will give us a consistent ATE estimate
われわれが計測できるのは非同意者を含むグループ平均値の差。非同意者がいるとインパクトが小さくなる。What we can measure is the mean group difference inclusive of noncompliance. Noncompliance makes estimated impacts smaller.
非同意者を含む効果推計値を治療意図に基づく効果intention-to-treat (ITT) effectという。The estimator under partial compliance is called intention-to-treat (ITT) effect, and is like a down-to-earth version of ATE.
さまざまな効果推計量(実証研究の大半がITTかLATE)
\[ \mbox{割り当ての結果への効果}=\mbox{割り当ての参加への効果}\times\mbox{参加の結果への効果} \]
\[ \begin{aligned} \mbox{参加}\Rightarrow\mbox{結果} &= \frac{\mbox{割り当て}\Rightarrow\mbox{結果}}{\mbox{割り当て}\Rightarrow\mbox{参加}}, LATE=\mbox{介入}\Rightarrow\mbox{結果} &= \frac{\mbox{割り当て}\Rightarrow\mbox{結果}}{\mbox{割り当て}\Rightarrow\mbox{介入}}, &= \frac{\mbox{割り当てによる処置群と統御群の結果の差}\alpha\mu - \beta\mu}{\mbox{割り当てによる処置群と統御群の介入比率の差}\alpha-\beta}, &=\frac{(\alpha - \beta)\mu}{\alpha-\beta}=\mu \end{aligned} \]
実験には人が意図して実施する科学実験と偶然発生する自然実験natural experimentsがある
科学実験は非倫理的なものは実施しない
自然実験は意図せず発生するので非倫理的であっても実施されてしまう
非倫理的な自然実験の例:
親の違いによる子の純資産額、所得、学歴、金融投資への影響
Fagereng, Mogstad, and Rønning (2021): 韓国の生活苦の乳児が養子縁組でノルウェイに行く
NGO: ノルウェイで養親候補を書類審査+面接、合格者の書類を韓国に送付、先着順で子どもと縁組
養親は子どもに関する希望を出せず、到着順はランダム
養親は年齢、学歴、所得、純資産額などで異なる
ランダムであることの確認:
養子全員がtreatedなのでpermutation testは使えない
親の違いによる子の純資産額、所得、学歴、金融投資への影響
親の違いによる子の純資産額、所得、学歴、金融投資への影響
養子\(i\)の特徴\(Y_{i}\)と養親\(j\)の\(k+1\)個の特徴\(W_{j}, x_{1j}, \dots, x_{kj}\)がどのように関係しているかを見たい (養親純資産額は\(W_{j}\), 養子の特徴も\(m\)個: \(x_{1i}, \dots, x_{mi}\))
親の違いによる子の純資産額、所得、学歴、金融投資への影響
\[ \begin{aligned} Y_{i} &= \overbrace{\alpha_{1965}Z_{1965}+\cdots+\alpha_{1986}Z_{1986}}^{\scriptsize{\mbox{縁組年の固定効果}}}+{\color{red}\beta} W_{j} &\hspace{1em} +\underbrace{\eta_{1}x_{1j}+\cdots+\eta_{k}x_{kj}}_{\scriptsize{\mbox{養親の特徴の効果}}} &\hspace{1em} +\underbrace{\lambda_{1}x_{1i}+\cdots+\lambda_{m}x_{mi}}_{\scriptsize{\mbox{養子の特徴の効果}}} \\[-3ex] &\hspace{1em} +\underbrace{\gamma\kappa_{j}+\delta\chi_{i}}_{\scriptsize{\mbox{養親と養子の各個人固定効果}}}+u_{i}. \end{aligned} \]
\({\color{red}\beta}\): 養親から養子への純資産額^の伝播係数
\(\beta\)は以下の効果を除いた上で推計されたものです
親の違いによる子の純資産額、所得、学歴、金融投資への影響
OLS推計結果
親の違いによる子の純資産額、所得、学歴、金融投資への影響
所得や学歴以外の家庭内の何かが子の純資産額を高める
参考: Barth, Papageorge, and Thom (2020) take aways
株式所有経由で資産格差を説明するのは共通
グループの割り振り(\(D_{i}\))がランダム化していないと、ごく稀なケースを除き、政策がない場合の結果指標の分布はグループ間で異なる。When the treatment assignment (\(D_{i}\)) is not randomised, except for very rare lucky cases, the distributions of outcome measure in the absense of a policy are different between the treated and the control.
被験者=目的意識を持って参加する人間なので、参加者と不参加者は特徴が異なるThis is because we are dealing with humans who participate purposefully.
What we will learn:
Implementation:
Get data:
Stjpg:
A simpler way: \(y^{DID}=a_{3}\) of the following regression.
回帰式って何?
説明するよりも見る方が分かりやすいので、まずはデータを用意します
wooldridgeパッケージをインストールlibrary(wooldridge)と入力しdata("wagepan")でRに読み込まれますデータの種類
package 'wooldridge' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\acorn\AppData\Local\Temp\RtmpG0Yv1h\downloaded_packages
nr year agric black bus construc ent exper fin hisp poorhlth
<int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int>
1: 13 1980 0 0 1 0 0 1 0 0 0
2: 13 1981 0 0 0 0 0 2 0 0 0
3: 13 1982 0 0 1 0 0 3 0 0 0
4: 13 1983 0 0 1 0 0 4 0 0 0
5: 13 1984 0 0 0 0 0 5 0 0 0
---
4356: 12548 1983 0 0 0 1 0 8 0 0 0
4357: 12548 1984 0 0 0 1 0 9 0 0 0
4358: 12548 1985 0 0 0 1 0 10 0 0 0
4359: 12548 1986 0 0 0 0 0 11 0 0 0
4360: 12548 1987 0 0 0 0 0 12 0 0 0
hours manuf married min nrthcen nrtheast occ1 occ2 occ3 occ4 occ5
<int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int>
1: 2672 0 0 0 0 1 0 0 0 0 0
2: 2320 0 0 0 0 1 0 0 0 0 0
3: 2940 0 0 0 0 1 0 0 0 0 0
4: 2960 0 0 0 0 1 0 0 0 0 0
5: 3071 0 0 0 0 1 0 0 0 0 1
---
4356: 2080 0 1 0 0 0 0 0 0 0 1
4357: 2080 0 1 0 0 0 0 0 0 0 1
4358: 2080 0 1 0 0 0 0 0 0 0 1
4359: 2080 0 1 0 0 0 0 0 0 0 1
4360: 3380 0 1 0 0 0 0 0 0 0 1
occ6 occ7 occ8 occ9 per pro pub rur south educ tra trad
<int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int> <int>
1: 0 0 0 1 0 0 0 0 0 14 0 0
2: 0 0 0 1 1 0 0 0 0 14 0 0
3: 0 0 0 1 0 0 0 0 0 14 0 0
4: 0 0 0 1 0 0 0 0 0 14 0 0
5: 0 0 0 0 1 0 0 0 0 14 0 0
---
4356: 0 0 0 0 0 0 0 1 1 9 0 0
4357: 0 0 0 0 0 0 0 1 1 9 0 0
4358: 0 0 0 0 0 0 0 1 1 9 0 0
4359: 0 0 0 0 0 1 0 1 1 9 0 0
4360: 0 0 0 0 0 0 1 1 1 9 0 0
union lwage d81 d82 d83 d84 d85 d86 d87 expersq
<int> <num> <int> <int> <int> <int> <int> <int> <int> <int>
1: 0 1.197540 0 0 0 0 0 0 0 1
2: 1 1.853060 1 0 0 0 0 0 0 4
3: 0 1.344462 0 1 0 0 0 0 0 9
4: 0 1.433213 0 0 1 0 0 0 0 16
5: 0 1.568125 0 0 0 1 0 0 0 25
---
4356: 0 1.591879 0 0 1 0 0 0 0 64
4357: 1 1.212543 0 0 0 1 0 0 0 81
4358: 0 1.765962 0 0 0 0 1 0 0 100
4359: 1 1.745894 0 0 0 0 0 1 0 121
4360: 1 1.466543 0 0 0 0 0 0 1 144
The data was used for estimating union impacts on wages. 1980 to 1987.
nr, agric, black, construc, exper, hisp, poorhlth, hours, manuf, educ, union, lwage.dunion == 0, control), or union == 0 in 1980 and union == 1 in 1987 (dunion == 1, treated).keepvar <- c("nr", "year", "agric", "black", "construc", "exper", "hisp", "poorhlth",
"hours", "manuf", "educ", "union", "lwage")
wagepan <- wagepan[, keepvar, with = F]
wagepan <- wagepan[year == 1980 | year == 1987, ]
setkey(wagepan, nr, year)
wagepan[, dunion := diff(union), by = nr]
wagepan <- wagepan[dunion >= 0 & union[year == 1980] == 0, ]
table(wagepan[, dunion])
0 1
612 112
factorcols <- c("agric", "black", "construc", "hisp", "poorhlth", "manuf", "union")
wagepan[, (factorcols) := lapply(.SD, as.factor), .SDcols = factorcols]
wagepan[, after := 0L]
wagepan[year == 1987, after := 1L]
summary(wagepan) nr year agric black construc exper
Min. : 13 Min. :1980 0:696 0:636 0:668 Min. : 0.000
1st Qu.: 2540 1st Qu.:1980 1: 28 1: 88 1: 56 1st Qu.: 3.000
Median : 4718 Median :1987 Median : 8.000
Mean : 5392 Mean :1984 Mean : 6.554
3rd Qu.: 8568 3rd Qu.:1987 3rd Qu.:10.000
Max. :12548 Max. :1987 Max. :18.000
hisp poorhlth hours manuf educ union
0:613 0:710 Min. : 120 0:531 Min. : 3.00 0:552
1:111 1: 14 1st Qu.:1956 1:193 1st Qu.:11.00 1:172
Median :2080 Median :12.00
Mean :2140 Mean :11.76
3rd Qu.:2410 3rd Qu.:12.00
Max. :4992 Max. :16.00
lwage dunion after
Min. :-1.114 Min. :0.0000 Min. :0.0000
1st Qu.: 1.305 1st Qu.:0.0000 1st Qu.:0.0000
Median : 1.648 Median :0.0000 Median :1.0000
Mean : 1.622 Mean :0.1547 Mean :0.5028
3rd Qu.: 1.991 3rd Qu.:0.0000 3rd Qu.:1.0000
Max. : 3.313 Max. :1.0000 Max. :1.0000
DID estimation: union参加(union=0→1)というtreatmentが賃金に与える効果
Call:
lm(formula = lwage ~ union + after + I(union * after), data = wagepan)
Residuals:
Min 1Q Median 3Q Max
-2.44510 -0.26950 0.03016 0.32441 1.49050
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.01422 0.08545 11.870 < 2e-16 ***
union 0.31706 0.07036 4.507 7.69e-06 ***
after 0.69315 0.11481 6.038 2.51e-09 ***
I(union * after) -0.20088 0.08927 -2.250 0.0247 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4873 on 720 degrees of freedom
Multiple R-squared: 0.217, Adjusted R-squared: 0.2137
F-statistic: 66.5 on 3 and 720 DF, p-value: < 2.2e-16
Compute DID by hand…union wages are high at start
Key: <union, after>
union after meanw
<num> <int> <num>
1: 1 0 1.331278
2: 1 1 1.823554
3: 2 0 1.648341
4: 2 1 1.939739
Key: <union>
union dmean.lwage
<num> <num>
1: 1 0.4922759
2: 2 0.2913973
[1] -0.2008786
回帰式の利点Advantages of regression
DID estimation with covariates: \(k\)個の他要因\(x_{1i}, \dots, x_{ki}\)を制御してunion参加(union=0→1)というtreatmentが賃金に与える効果
\[ y_{i,t}=a_{0}+a_{1}D_{i}+a_{2}after_{t+1}+a_{3}D_{i}*after_{t+1}+b_{1}x_{1i}+dots+b_{k}x_{1k}+e_{i,t} \]
did2 <- lm(data = wagepan, lwage ~ union + after + I(union*after) + educ + exper + hours + agric + construc + manuf + black + hisp + poorhlth)
summary(did2)
Call:
lm(formula = lwage ~ union + after + I(union * after) + educ +
exper + hours + agric + construc + manuf + black + hisp +
poorhlth, data = wagepan)
Residuals:
Min 1Q Median 3Q Max
-2.60937 -0.25180 0.05089 0.27899 1.43828
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.912e-01 3.033e-01 -0.960 0.337363
union 2.834e-01 6.761e-02 4.192 3.12e-05 ***
after 2.659e-01 1.437e-01 1.851 0.064570 .
I(union * after) -1.527e-01 8.445e-02 -1.808 0.071020 .
educ 1.012e-01 1.219e-02 8.302 5.17e-16 ***
exper 4.968e-02 1.288e-02 3.858 0.000125 ***
hours -2.462e-05 2.880e-05 -0.855 0.392900
agric -1.703e-01 9.156e-02 -1.860 0.063294 .
construc 1.123e-01 6.663e-02 1.685 0.092385 .
manuf 1.608e-01 4.055e-02 3.965 8.07e-05 ***
black -1.327e-01 5.466e-02 -2.428 0.015450 *
hisp 2.194e-02 4.914e-02 0.447 0.655344
poorhlth 4.170e-02 1.254e-01 0.333 0.739517
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4591 on 711 degrees of freedom
Multiple R-squared: 0.3136, Adjusted R-squared: 0.302
F-statistic: 27.07 on 12 and 711 DF, p-value: < 2.2e-16
Summarise estimated results
package 'modelsummary' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\acorn\AppData\Local\Temp\RtmpG0Yv1h\downloaded_packages
package 'tinytable' successfully unpacked and MD5 sums checked
The downloaded binary packages are in
C:\Users\acorn\AppData\Local\Temp\RtmpG0Yv1h\downloaded_packages
| simple | with covariates | |
|---|---|---|
| (Intercept) | 1.014 | -0.291 |
| (<0.001) | (0.337) | |
| union | 0.317 | 0.283 |
| (<0.001) | (<0.001) | |
| after | 0.693 | 0.266 |
| (<0.001) | (0.065) | |
| I(union * after) | -0.201 | -0.153 |
| (0.025) | (0.071) | |
| educ | 0.101 | |
| (<0.001) | ||
| exper | 0.050 | |
| (<0.001) | ||
| hours | 0.000 | |
| (0.393) | ||
| agric | -0.170 | |
| (0.063) | ||
| construc | 0.112 | |
| (0.092) | ||
| manuf | 0.161 | |
| (<0.001) | ||
| black | -0.133 | |
| (0.015) | ||
| hisp | 0.022 | |
| (0.655) | ||
| poorhlth | 0.042 | |
| (0.740) | ||
| Num.Obs. | 724 | 724 |
| R2 | 0.217 | 0.314 |
| R2 Adj. | 0.214 | 0.302 |
| AIC | 1019.7 | 942.3 |
| BIC | 1042.6 | 1006.5 |
| Log.Lik. | -504.854 | -457.163 |
| F | 66.499 | 27.072 |
| RMSE | 0.49 | 0.45 |
DIDの識別仮定: 介入がないとき、結果指標の変化が群間で似ていること。共通トレンドの仮定 common trend assumption.
識別仮定List of identifying assumptions.
効果を識別identifyしているならば成立しなくてはならない仮定: どのくらい現実的か=推計値の信頼度credibility of estimate
In the absence of the policy: \(\delta(A)\) reads “distribution of \(A\)”
For DID we need:
You need to get the control data even before the policy starts.
Before-after:
With-without:
With-without:
Before-after:
同意なきTOB(takeover bid, 株式公開買付)
事前同意のないTOBを受けた日本企業の業績を集計したところ、TOB実施年から2期後までに平均の営業利益率が2.4ポイント低下した。不採算事業の整理に加え、買収された企業が激しく抵抗することも多い。
What is the CF?
自然実験
オランダ飢餓の冬(1945年1月-4月)への胎内曝露 (Lumey and Stein 1997)
成人1人当たり配給カロリー(飢餓の冬は1000カロリー/日)
データ:
Lumey and Stein (1997) : 飢餓の冬生まれ vs. その他期間生まれ(Before-afterに近い)
---
displayMode: compact
---
gantt
title 誕生年月によるtreatment status
dateFormat YY-MM
axisFormat %Y-%b
tickInterval 1month
Control 1: done, 1944-08, 6M
第3三半期曝露: crit, 1945-02, 5M
第2三半期曝露: crit, 1945-05, 5M
第1三半期曝露: crit, 1945-08, 5M
Control 2: done, 1946-01, 4M
section Treatment
Famine: crit, 1945-01, 4M
section 第1三半期曝露(半月)
第1三半期: done, crit, t11, 1945-04-15, 12w
第2三半期: active, t12, after t11, 12w
第3三半期: after t12, 12w
section 第1三半期曝露(フル)
第1三半期: done, crit, t21, 1945-02-06, 12w
第2三半期: active, t22, after t21, 12w
第3三半期: after t22, 12w
section 第1三半期曝露(フル)<br>+第2三半期曝露(半月)
第1三半期: done, crit, t31, 1945-01-22, 12w
第2三半期: active, t32, after t31, 12w
第3三半期: after t32, 12w
section 第1三半期曝露(半月)<br>+第2三半期曝露(フル)
第1三半期: done, crit, t41, 1944-10-09, 12w
第2三半期: active, t42, after t41, 12w
第3三半期: after t42, 12w
section 第2三半期曝露(半月)<br>+第3三半期曝露(フル)
第2三半期: done, crit, t51, 1944-07-17, 12w
第2三半期: active, t52, after t51, 12w
第3三半期: after t52, 12w
section 第3三半期曝露(半月)
第3三半期: done, crit, t61, 1944-05-12, 12w
第2三半期: active, t62, after t61, 12w
第3三半期: after t62, 12w
\[ \begin{aligned} \mbox{子どもの周産期}&(W22-D7)\mbox{死亡率} \\ &\hspace{-4cm}=\mbox{他期間生まれ}+a_{1}*\mbox{第1三半期曝露} \\ &\hspace{-2cm} +a_{2}*\mbox{第2三半期曝露} +a_{3}*\mbox{第3三半期曝露}+\mbox{誤差項} \end{aligned} \]
\(a_{1}, a_{2}, a_{3}\)がゼロ \(\Leftrightarrow\) 曝露の影響は他期間生まれに比べてゼロ
\(a_{1}, a_{2}, a_{3}\)で曝露の影響が測れるための識別仮定: 同じ地域生まれであれば、飢餓の冬がなければ、全てのコーホート(1944年8月-1946年4月)の死亡率は一定=死亡率にコーホート効果なし
そうかもしれないし、そうじゃないかもしれない
CF=他期間生まれ
信頼性のより高いデザイン・推計方法(DID): 全ての地域のコーホート・パネル・データ
\[ \begin{aligned} \mbox{Ams子どもの周産期}&\mbox{死亡率}=\mbox{Ams他期間生まれ}+a_{1}*\mbox{Ams第1三半期曝露} \\ \mbox{1年前産まれのAms子どもの周産期}&\mbox{死亡率}=\mbox{Ams他期間の1年前産まれ}+a_{1}*\mbox{Ams第1三半期曝露の1年前産まれ} \\ \mbox{Other子どもの周産期}&\mbox{死亡率}=\mbox{Other他期間生まれ}+a_{1}*\mbox{Other第1三半期曝露} \\ \mbox{1年前産まれのOther子どもの周産期}&\mbox{死亡率}=\mbox{Other他期間の1年前生まれ}+a_{1}*\mbox{Other第1三半期曝露の1年前産まれ} \\ \end{aligned} \] \[ \begin{aligned} \mbox{Ams子どもの周産期}&\mbox{死亡率}- \mbox{1年前産まれのAms子どもの周産期}\mbox{死亡率}\\ & - (\mbox{Other子どもの周産期}\mbox{死亡率}-\mbox{1年前産まれのOther子どもの周産期}\mbox{死亡率})\\ &\hspace{-6cm}= (\Delta\mbox{Ams他期間生まれ}-\Delta\mbox{Other他期間生まれ})\\ &\hspace{-2cm}+ a_{1}*(\Delta\mbox{Ams第1三半期曝露} - \Delta \mbox{Other第1三半期曝露})+\Delta \mbox{誤差項} \end{aligned} \]
全ての特徴を観察できれば結果の差をすべて説明できる。が、観察できない。
実験でなく、パネル・データが(=DIDができ)ないとき、どうすれば良いのか? What can be done if we do not have panel data?
Good news: インパクト評価の範囲を狭くすれば、推計可能。 Over a narrower domain, impacts can be estimated.
Consider a poverty reduction policy that gives a subsidy to the people below the poverty line.
Suppose poverty line is USD 1.25 per day and this criteria is strictly enforced. So if your income is USD 1.24 per day, you get the money. If your income is USD 1.25, you don’t.
People with daily income of USD 1.24 and USD 1.25 are similar.
Estimate impacts by comparing BPL and APL near the poverty line.
The narrower focus around cutoff gives us a “matched pair” of the treated and the control, or a pseudo counterfactual.
Interpretation of estimates: Policy impacts on the subpopulation near the cutoff. It is a local impact near the cutoff, not a global impact such as ATE (or ATT, ATC).
Cutoff前後で資格が0から1に変わるため、RDD推計量をLATE推計量と表現する人もいる
Applications: Cutoffs, geographical boundaries.
Policies are full of cutoffs. So almost every policy has a chance of estimating its impacts near the cutoff.
Identifying assumption:
There is nothing other than the policy which “jumps” discretely around the cutoff point. So a jump in the outcome is attributed only to the policy.
But there is a catch: (Because we fit the line locally around the cutoff neighbourhood) It takes a large sample to use RDD estimator with the order of 10,000.
因果関係を示す方法: 回帰不連続regression discontinuity design (RDD)
右辺の変数が急に変化する状況を見つけ、その前後で左辺の変化を観察する
teacher-pupil ratio \(\Rightarrow\) exam score
メモニデス(中世のトーラー学者)による戒律
“Only up to 40 students in one class….”
The Government of Israel still holds it.
Ingenuity of Angrist and Lavy (1999): Predicited class size vs. exam scores.
The Government of Israel still holds it.
Ingenuity of Angrist and Lavy (1999): Predicited class size vs. exam scores.
推計結果の読み方
\[ LHS = a+b_{1}*RHS_{1}+b_{2}*RHS_{2}+\dots+b_{k}*RHS_{k}+e \]
Reading comprehension
国語読解の点数
(1)…(6): 6つの推計式
\(+/5\) discontinuity sample: カットオフの$$5点以内の標本のみを使った推計
Math
数学の点数
(7)…(12): 6つの推計式
カットオフ=学級サイズが急激に減少する人数(理論値)
横浜市2009年40人学級: 小6国語(共通試験点数偏差値)
Akabayashi and Nakamura (2014)
横浜市2009年40人学級: 中3国語(共通試験点数偏差値)
Akabayashi and Nakamura (2014)
赤林さんは中3国語で期待した成果が出なかったことに驚くが、以下のように解釈 https://synodos.jp/education/12530
少人数学級=きめ細やかな指導が可能、なので、自動的に成績が上がるわけではない
教員の指導能力、意欲、効率性重視方針も必要
教員の数が増えれば能力が低い、意欲が弱い人も雇用される
伸び代が高い生徒に注力(効率性重視)するか、成績の低い生徒に注力(公平性重視)するか
情報開示請求で得た学校平均点数と学年生徒数のデータなので、実際のクラス数(よって、実際のクラス・サイズ)は分からない模様
点数がより変化しやすそうな英語や数学の結果が知りたい
中室牧子さん: 35人学級は、2011年に公立小学校の1年生に対してのみ導入されました。財務省は、2011年以前と以後で、いじめ、暴力行為、不登校の平均値を比べると、いじめや暴力、不登校には大きな変化が見られないので、少人数学級には効果がない。したがって、「40人学級に戻すべき」と主張したのです。
Placebo tests
RDDは局地的な実験と捉えられる
境界内外で越境があったとしても、treatment assignmentについて人々の意向が不正確にしか反映されなければ、ランダムな割当の要素があるから
実験と同様、density testはランダム化を達成できたか検定
RDD での識別仮定の信頼性チェック
PTは論理的なチェックで傍証。DTはランダム化の検定。
Density testの例
確率密度は境界でジャンプしていないことが視覚的に分かる(検定結果の統計値は-.007、標準誤差が.006)
識別仮定の信頼性チェック
国や(関東など大きな)地方単位でインパクトを推計したいときもある
2020年12月14日(月)GoToトラベル全国一斉一時停止
エビデンス=科学的な方法で明らかになった事象
科学的な方法: 反証可能な命題が成立するか検定する方法
「GoToトラベルやって感染拡大を絶対招いちゃったけど、エビデンスはないから」
エビデンスがないのは事実
利用可能なデータを前提にすると、どのような効果検証が可能か?
2020年12月14日(月)GoToトラベル全国一斉一時停止
記者「GoToトラベルに感染拡大のエビデンスがないとの認識はあったか?」
(NHKサイトでは「GoToトラベルに感染拡大のエビデンスはないという認識は変わったのか」)
管首相
「そこは、
エビデンスはなく(と会長が言っているだけで自分は言ってない)、移動は感染を広げないと(誰から?)聞いていたが、感染者数が増えたから停止、という主張
2020年12月14日(月)GoToトラベル全国一斉一時停止
2020年11月18日(水)日本医師会会長中川氏
「GoToトラベル自体から感染者が急増したというエビデンス(根拠)はなかなかはっきりしないが、きっかけになったことは間違いないと私は思っている。感染者が増えたタイミングを考えると関与は十分しているだろう」
2020年12月16日(水)衆院内閣閉院中審査: 新型コロナウィルス感染症対策分科会会長尾身氏
「50歳以下の人が移動して二次感染を起こしていることがはっきりしきたので、人の動きを止めることが重要で、その一環のなかでGoToトラベル(一時停止)もある」「本質は意図せず重症化が出るので、そのような文脈のなかでGoToトラベルも考えるべきと再三申し上げている」
効果推計の例
よくある比較
GoToトラベル実施月の旅客人数を前年度同月値と比較して「x%多かった」と示す
昨年度と比較=GoToトラベルなしだと昨年と同じという(暗黙の?)仮定をしている
このデザインでの効果推計値の信頼性=この識別仮定の現実妥当性
課題
誰にでもできる分析なので、何と比較すべきかを考えずにやっている人が多いはず
「今年はコロナウィルス流行によって大きく減っているという事情はありますが」などと、景気後退の影響について数字以外の補正をして説明するはず
効果があったのかはっきりしないし、聞き手の主観が入り込む
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
2020年12月8日(火)
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
研究デザイン
GoToトラベル利用者は非利用者よりも有症率が2倍
解釈: 以下の可能性がある
結論: 「リスクの低い人に経済活動の誘因を与え、高い人は自宅待機を促すべき」
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
閣僚の反応
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
示した解釈が面白いし、明確な政策提言になっている
結果の提示も慎重「因果関係を示している訳ではない」
しかし… この研究には方法論として弱点があると思います
何でしょうか?
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
示したこと: 有症率(A)とGoToトラベル利用(B)の正の相関
検討していない可能性: みせかけの相関
その他の現象(C)が(A)と(B)を同時に動かしているのでは?
Cの例: 外出量
外出好きな人は罹患確率[\(\propto\)有症率(A)]が高い
⇒ 外出好きな人は旅行をよくする(行くのだったら割引を使う)
⇒ 外出好きな人は罹患しやすく、旅行も頻繁にする、というだけでは?
もしもそうだったら、結論は常識の範囲内
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
政策提言が実施困難: どうやって個人の感染させるリスクを判断するのか?
年齢: 年齢差別になりかねず、違憲の可能性あり
もしも可能だったら…ランダムにGoToトラベル資格を配布する実験をする
有資格者と無資格者の有症率の違いを検定する: 明確な因果関係
でも、有資格者と周辺者が危険に曝される可能性があるので、研究倫理審査委員会が却下するかも
GoToトラベル=研究倫理審査委員会が却下しかねない政策
「GoToトラベル利用者感染リスク高い」東京大学など研究チーム
普段の外出頻度を尋ねていれば、外出頻度を制御して有症率を比較
\[ \Delta \Pr(\mbox{有症}|\mbox{外出多})=\Pr[\mbox{有症}|\mbox{外出多, } \color{red}{GoTo利用}]-\Pr[\mbox{有症}|\mbox{外出多, } \color{red}{GoTo非利用}]. \]
条件付き確率\(\Pr(A|B)\) probability of A given B: Bが起こるときにAが起こる確率
外出頻度ごとに帰無仮説を検定 \[ \begin{aligned} H_{01}&: \Delta \Pr(\mbox{有症}|\mbox{外出少})=0\\ H_{02}&: \Delta \Pr(\mbox{有症}|\mbox{外出多})=0 \end{aligned} \]
仮に、それぞれの帰無仮説において\(p\) valueが小さい
\(\Rightarrow\) 外出頻度同程度の人でGoToトラベルと有症率に正の相関関係
\(\Rightarrow\) GoToトラベルが有症率を高める因果関係と矛盾しない
残念ながら、外出頻度は尋ねていない模様
デザイン段階でもう少し考えるべきだったかも?
グレンジャー因果性Granger causality: \(A\) Granger-causes \(B\)
グレンジャー因果性Granger causality: \(A\) Granger-causes \(B\)
東京追加による東京圏(例: 静岡県)の新規感染者数の変化
被説明変数と相関のある変数で、静岡の値と他の非東京圏道府県の加重平均値の差(の2乗和)を最小化するように加重平均ウェイトを選ぶ。このウェイトと非東京圏の被説明変数データを使って合成静岡の被説明変数値を計算する。
東京追加による東京圏(例: 静岡県)の新規感染者数の変化
課題
実は、CFがなくてもインパクト評価を可能にする方法があるBut there is an ingenious way that allows impact evaluation
用いる仮定: 観察可能な変数による選抜selection on the observable
観察可能な変数で統御群と治療群への選抜が説明可能 =観察可能な特徴を考慮すれば、統御群と治療群への割り振りがランダム(選抜がない)と考えられる
ここで「ランダム」とは?
観察可能な特徴を考慮すれば、効果の大きさと治療状態が相関していないこと
=効果の大きい/小さい人ほど治療群になりやすい、がないこと
観察可能な特徴を考慮すれば、治療状態と結果が無相関/統計的に独立を条件付無相関conditional orthogonality/条件付独立conditional independenceという
selection on the observableは滅多に満たされない
人間は自分にとって得なことを選択する(=選抜がある)し、選抜に関わる観察不可能な情報が必ずある
では、なぜこんな仮定をおいてインパクト評価をするのか?
何もやらないよりも、仮定と限界を明示して作業する方が意義があるため
手法開発者の意図
オリジナルの開発者の崇高な意志に反して仮定もよく考えずにインパクト評価をやってしまう例は多いが…
Abadie and Gardeazabal (2003): テロがバスク郡の経済成長に与える影響を推計。スペインでテロはバスク郡以外にはない。They want to estimate the terrorism impacts on growth of Basque county. Terrorism affected only Basque but nowhere else in Spain.
アイディア: それ以外の郡すべて(donor pool'')からCFを合成They proposed to synthesise a control observation out of all other counties (donor pool’’).
\[ ATT_{basque,t}=\underbrace{y_{basque, t}}_{\scriptsize{\mbox{バスク}}}-\underbrace{\sum_{j=1}^{J}w_{j}y_{j,t}}_{\scriptsize{\mbox{バスク以外の加重平均}}}, \quad 0\leqslant w_{j} \leqslant 1, \ \sum_{j=1}^{J}w_{j}=1. \]
テロ開始前データを使って、テロ無しバスクと加重平均の誤差の2乗和が最小化するようにウェイト\(w_{j}\)を選ぶ
\(w_{j}\)の計算方法 (テロ前T期、テロ発生以降\(T+1, T+2, \dots\))Computing \(w_{j}\)
2乗和関数とは \[ \begin{aligned} e_{it}(w_{1}, w_{2}, \dots, w_{J})^{2} &= \{t\mbox{期の変数$i$の誤差}(w_{1}, w_{2}, \dots, w_{J})\}^{2},\\ &= (z_{i\scriptsize{\mbox{バスク}}t}-w_{1}z_{i1t}-w_{2}z_{i2t}-\dots-w_{J}z_{iJt})^{2} \end{aligned} \] \[ \begin{aligned} e_{i1}(w_{1}, &w_{2}, \dots, w_{J})^{2}+e_{i2}(w_{1}, w_{2}, \dots, w_{J})^{2}+\dots+e_{iT}(w_{1}, w_{2}, \dots, w_{J})^{2}\\ &= \{\mbox{各期の変数}i\mbox{の誤差}(w_{1}, w_{2}, \dots, w_{J})\}^{2}\mbox{の和} \end{aligned} \] \[ \begin{aligned} \sum\limits_{i=1}^{I+1}&\sum\limits_{t=1}^{T}\left(z_{ibt}-\sum\limits_{j=1}^{J}w_{j}z_{ijt}\right)^{2}= e_{11}(w_{1}, w_{2}, \dots, w_{J})^{2}+\dots+e_{1T}(w_{1}, w_{2}, \dots, w_{J})^{2}\\ &\phantom{=}+ e_{21}(w_{1}, w_{2}, \dots, w_{J})^{2}+\dots+e_{2T}(w_{1}, w_{2}, \dots, w_{J})^{2}\\ &\phantom{=}\dots+ e_{I+11}(w_{1}, w_{2}, \dots, w_{J})^{2}+\dots+e_{I+1T}(w_{1}, w_{2}, \dots, w_{J})^{2}\\ &\hspace{-3cm}= \{\mbox{各期の変数}1\mbox{の誤差}(w_{1}, w_{2}, \dots, w_{J})\}^{2}\mbox{の和}+ \{\mbox{各期の変数}2\mbox{の誤差}(w_{1}, w_{2}, \dots, w_{J})\}^{2}\mbox{の和}\\ &\phantom{=}+\dots +\{\mbox{各期の変数}I+1\mbox{の誤差}(w_{1}, w_{2}, \dots, w_{J})\}^{2}\mbox{の和} \end{aligned} \]
SCMが適しているデータSCM can be applied to the study with a small number of cross sectional units but with a relatively long (e.g., 10-30 periods) pre-policy observation period (``training period’’)
推計期間での予測誤差が大きいとイベント後の予測も精度が低いので、使えないIf the fit of (within sample) prediction during training period is bad, there is nothing you can do.
短所 :どの程度の誤差なら良いのか現在は基準がない、共変数選定の基準がない、イベント前データが長期に必要
長所 :比較対象の選択基準を客観化、プラセボ分析が可能
条件付き直交の意味
治療群と統御群は観察可能な変数のみを基準に選抜された
テロリストが(カタルーニャやマドリよりも)バスクを選んだのは成長率が下がって不満を持った市民や支持を得られそうと思った(=観察不可能な思い込み)、からではない」
「成長を低めテロを育てるような要因(例: 分離独立運動)はない」
「共変数\(\bfx\)を考慮すれば、テロがなければ成長はほぼ同じだった」
「テロが起こるとすればバスクしかなかったが、テロの原因と成長とは関係がない」
SCMの考え方: 共変数が似ていれば結果も似ているはず
暗に仮定している共変数と結果の関係This assumes that the relationship (supposedly derived from a theoretical model but never explicitly shown) between predictors and outcomes are:
強い仮定に思えるが、これらは叙述的研究も同じBut these may be the same for qualitative, narrative studies.
叙述的研究と比べた長所
Abadie, Diamond, and Hainmueller (2010) :
Pinotti (2015)
Pinotti (2015)
Pinotti (2015)
Pinotti (2015)
Pinotti (2015)
It is still possible that something other than mafia violence caused the slowdown of industrial growth of Apulia and Basilicata, starting from early 1970’s. But what is it? If none is found, SCM (may not be very credible but) is convincing.
Pinotti (2015) also shows that;
He argues that increased public investments were channeled to mafia activities through corrupt politicians, and quality of elected politicians reduced (shown in the companion paper).
Pinotti (2015)
Billmeier and Nannicini (2013)
Billmeier and Nannicini (2013)
Billmeier and Nannicini (2013)
Billmeier and Nannicini (2013)
Billmeier and Nannicini (2013)
Billmeier and Nannicini (2013)
怪しい結果に思える。貿易自由化していないdonor poolを使って加重平均を合成
共変数: 中等就学率、人口増加率、投資/GDP、インフレ率、民主主義インデックス
共変数が似ていて貿易自由化していなくても、成長率は人口規模、天然資源、気候変動、紛争などによっても影響される
どこまで共変数として含めれば良いのか、誰も説得的な議論はできない
しかし、叙述的研究はそういうことをやっている
選定基準を明確化して数値化していることは貢献
It is fair to say that ex post evaluation uses a poor method in estimating impacts which should not be taken too seriously. ::: {style=“font-size: 40%;line-height: 1.1;”} http://www.jica.go.jp/english/our_work/evaluation/tech_and_grant/project/ex_post/about.html :::
We believe the policy had an impact, however, it is difficult to know. (honest!)
Based on the responses from beneficiaries, it is confirmed … was improved. (subjective)
…one can judge that the effect was an increase in income. (unsubstantiated)
…it is perceivable that the policy provided a support for growth. (unsubstantiated)
… it is considered that the effects on job creation was sufficient. (subjective)
We cannot learn which policy was effective.
CGD document: When will we ever learn? (Evaluation Gap Working Group 2006)
Asking, do we know how to improve outcomes of the poor? After more than 50 years of aid business?
Donor agencies’ evaluation professionals did not have a good answer.
We need to produce knowledge from past policies for future policies.
RCTではないこと、統御群データがないことなどから、実施したインパクト評価(before-after)の信頼性credibilityは低く、成果がよく分からないまま終わった。壮大な実験であり得たのに、評価の準備をしていなかった。
Buse, Ludi, and Vigneri (2008) : Before-after比較
なぜ信頼性の高いインパクト評価が可能な準備をしなかったのか?
A short answer: インパクト評価に関する勘違い(もしくはその振りをした)
Sachsらによる説明とDavid MacKenzie (世銀)による反論 (https://blogs.worldbank.org/impactevaluations/jeff-sachs-the-millennium-villages-project-and-misconceptions-about-impact-evaluation)
真の理由?
全ての推計方法への批判1: multiple testing (\(p\) hacking)
全ての推計方法への批判2: small sample bias
Gertler et al. (2014), Jamaica: 早期児童発達介入で成人時所得が25%増加(報告当初は42%だったが訂正), 治療群+統御群=109人
Heckman et al. (2010), Perry preschool: 内部収益率7-10% (研究当初は15-17%だったが訂正), 治療群+統御群=123
Campbell et al. (2014), Abecederian: 成人時血圧など改善、治療群+統御群=111→33(35歳)
ヘックマンらの研究では認知能力(IQ)と非認知能力(中身=executive function、忍耐力、やる気grit、対人スキル)の両方が所得と関わっており、前者は3-5歳くらいまでに決まるが後者はそれ以降も変化する、としている
まとめ
効果推計の議論にはレヴェルがある: 初心者、プロ、応用
相関関係: 3通りの因果関係、見せかけの相関
因果関係: 方向性のある関係
社会科学データで因果関係を直接観察できることは非常に稀
(← 社会経済は相互依存: 原因も何かの結果)
多くの「効果」の議論: 相関関係を因果関係に解釈している可能性
(← 因果関係と解釈した方が進化で生存可能性が高かった(説))
(回帰)式は左右が等しいことを示すだけ、因果の方向は示さない
効果\(=\)影響を受けたときの結果\(-\)影響を受けなかったときの結果
CF(多くの場合は統御群)を作り出す仮定が必要
この仮定が現実的=信頼性の高い効果推計値
多くの「効果」の議論: CF=beforeやwithout、信頼性が低い
← 選抜があるため
因果関係を測定する推計方法
(他にもある…Wald (instrumental variables) estimator、matching estimator)
with-withoutはRCTのみ、before-afterは統御群も必要
placebo test: 効果があり得ない部分で効果計測、効果検知すると推計値を疑問視、しかし、「出ないでほしい」という思いを叶えるような\(p\) hacking可能
信頼性の高い推計方法でも、\(p\) hacking, small sample biasは存在することに注意
仮に信頼性の高い効果推計値を得ても、外的整合性があるかは別問題
全ての推計方法は効果発現メカニズム(理論)を明らかにしない
メカニズムが分からないと適用可能性が分からない
しかし、メカニズムを示唆する検討が可能なこともある
例: マフィア\(\Rightarrow\)民間の投資・雇用低下、政府の投資・雇用増加\(\Rightarrow\)成長低下
イタリアで起こったことは日本でも起こるか?
現代日本で暴力団抗争が激化しても、同じメカニズムが働くとは限らない
理由: 警察が強いから。抗争に一般人を巻き込むと警察が弾圧。 「賃金中央値までなら最低賃金引き上げは雇用を減らさない」「余地の大きい日本でも引き上げよう」
アメリカやイギリスでそう(DID)でも、日本でそうかは分からない ハンガリー: 引き上げの75%が消費者に転嫁、10%雇用減(DID)
理由: 労働市場集中度、産業構成(とくに貿易財比率)、雇用慣行、労働規制が違う